داستان آبیدیک

ریشه یابی


english

1 computer:: Stemming

همچنین با استفاده از ریشه یاب خودکار واژگان فارسی، تغییرات کیفی سیستم در هنگام استفاده از ریشه یابی واژگان نیز مورد بررسی قرار گرفت. به طور کلی در مواردی که بالا بودن مقدار «دقت» اهمیت بیشتری نسبت به مقدار «بازخوانی» دارد، استفاده از ریشه‌یابی واژگان توصیه نشده است، اما اگر بالا بودن مقدار بازخوانی اهمیت بیشتری داشته باشد، ریشه‌یابی واژگان به امر این کمک شایانی می‌نماید. ریشه‌یابی اسمها، صفتها، قیود و فعلهای زبان فارسی درخطایاب املایی پیاد ه‌سازی شده است. مصادر افعال در زبان فارسی بر اساس زمان، جداسازی شده و ریشه یابی را با توجه به زمان آن ها بررسی کرده و وضعیت ضمایر متصل نیز در آن حل شده است. حذف واژه های پرتکرار عمومی (stop words) تطابق با لیستی از این واژه ها (مانند ضمایر، قیود، حروف اضافه و ربط که پرتکرار هستند، تشخیص و اصلاح کلمات کلیدی که کاربر به اشتباه وارد کرده است ( با توجه به عدم هماهنگی گذاشتن فاصله و نیم فاصله در کلمات فارسی) ، ریشه یابی کلمات که مستلزم شناخت دستور زبان و ایجاد ماشین متناسب با ساختار زبان فارسی است که در آن نمایه ساز کلمه را با پیشوندها و پسوندها در چند مرحله تطابق داده تا ریشه کلمه استخراج شود، استفاده از الگوهای مختلف وزن دهی، که این وزن، بیانگر میزان تاثیر کلمه به موضوع متن در مقایسه با سایر کلمات به کار رفته است.

واژگان شبکه مترجمین ایران


معنی‌های پیشنهادی کاربران

نام و نام خانوادگی
شماره تلفن همراه
متن معنی یا پیشنهاد شما
Captcha Code